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摘要 :【 目 的 ] 本 研究 间 在 探索 使 用 先进 的 计算 机 视觉 技术 实现 对 昆虫 图 像 的 自动 分 类 方法 。[【 方 法 ] 通 过 预 处 理 
对 采集 的 昆虫 标本 图 像 去 除 背 景 ,获得 昆虫 图 像 的 前 景 蒙 板 , 并 由 蒙 板 确定 的 轮廓 计算 出 前 景 图 像 的 最 小 包围 盒 ， 
剪 切 出 由 最 小 包围 盒 确 定 的 前 景 有 效 区 域 ,然后 对 剪 切 得 到 的 图 像 进 行 特 征 提取 。 首 先 提取 颜色 名 特征 ,把 原来 
的 RGB( Red-Green-Blue) 图 像 的 像素 值 映射 到 11 种 颜色 名 空间 ,其 值 表 示 RGB 值 属于 该 颜色 名 的 概率 ,每 个 颜色 
名 平面 划分 成 3 x3 像素 大 小 的 网 格 ,用 每 格 的 概率 均值 作为 网 格 中 心 点 的 描述 子 ,最 后 用 空 阔 金 字 塔 直方 图 统计 
的 方式 形成 颜色 名 视觉 词 袋 特征 ;其 次 提取 OpponentSIFT( Opponent Scale Invariant Feature Transform ) 特征 ,首先 把 
RGB 图 像 变 换 到 对 立 色 空间 ,对 该 空间 每 通道 提取 SIFT 特征 ,最 后 用 空域 池 化 和 直方 图 统计 方法 形成 
OpponentSIFT 视觉 词 袋 。 将 两 种 词 袋 特 征 串 接 后 得 到 该 昆虫 图 像 的 特征 向 量 。 使 用 昆虫 图 像样 本 训练 集 提 取 到 
的 特征 向 量 训练 SVM(Support Vector Machine ) 分 类 器 ,使 用 这 些 训练 得 到 的 分 类 器 即 可 实现 对 鳞 翅 目 昆 虫 的 分 类 
识别 。【 结果】 该 方法 在 包含 10 种 576 个 样本 的 昆虫 图 像 数据 库 中 进行 了 测试 ,取得 了 100% 的 识别 正确 率 。【 结 
论 ] 试验 结果 证 明基 于 颜色 名 和 OpponentSIFT 特征 可 以 有 效 实现 对 鳞 翅 目 昆 虫 图 像 的 识别 。 

关键 词 : 鳞 运 目 ; 图 像 识别 ; 颜色 名 ; OpponentSIFT; 视觉 词 袋 ; 支持 向 量 机 
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了 Recognition of lepidopteran species based on color name and 












































































































































































































































































































































OpponentSIFT features 

ZHU Le-Qing”*, ZHANG Da-Xing’, ZHANG Zhen (1. School of Computer Science and Information 
Engineering, Zhejiang Gongshang University, Hangzhou 310018, China; 2. Institute of Graphics and 
Image, Hangzhou Dianzi University, Hangzhou 310012, China; 3. Key Laboratory of Forest Protection of 
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Academy of Forestry Sciences, Beijing 100091, China) 

Abstract: [Aim] This study aims to realize the automatic insect image recognition by exploring the state- 
of-art computer vision technology. [ Methods 】The captured insect image was first preprocessed to remove 
the background and get the foreground mask. The minimum bounding box of the foreground was computed 
and the valid foreground region was cut out accordingly. The features on this valid region were extracted. 
The color name feature was extracted firstly. The pixels on original RGB (Red-Green-Blue) image were 
mapped to 11 color name planes, where the value represented the probability of the RGB value belonging 
to particular color name. Each color name plane was divided into blocks of 3 x 3 pixels. The average 
probability in each block was calculated and 11 values from 11 color name planes formed the descriptor of 
the center pixel in the grid. Finally, the bag-of-visual-word features for color name descriptors were 


generated by histogram statistics on spatial pyramid. For OpponentSIFT (Opponent Scale Invariant Feature 
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Transform ) feature extraction ，the image was first transformed from RCB space to opponent color space， 


SIFT descriptors from different channels were extracted and concatenated, and then were pooled into 


OpponentSIFT bag-of-visual-words with histogram statistics on spatial pyramid. Two types of bag-of- 


visual-word features were concatenated into feature vector of the insect image. SVM ( Support Vector 


Machine ) classifiers were trained with the feature vectors extracted from training set and were used to 


recognize lepidopteran species through _ classification. 【 Results 】The proposed method was tested in a 


database with 576 insect images and the recognition accuracy reached 100%. 


【 Conclusion 】 The 


experimental results prove that the lepidopteran images can be recognized efficiently by using color name 


and OpponentSIFT features. 


Key words: Lepidoptera; image recognition; color names; OpponentSIFT; bag-of-visual-word; Support 


Vector Machine (SVM) 

















鳞 翅 目 昆 虫 是 农业 上 的 主要 害虫 类 群 ,目前 全 
世界 已 知 鳞 翅 目 近 20 万 种 ,我 国 已 知 鳞 翅 目 昆 虫 
8 000 多 种 , 绝 大 多 数 是 植 食性 ,其 种 类 多 ,危害 重 。 
主要 以 幼虫 取 食 植物 叶肉 、 或 星 食 树干 . 树 皮 和 树 根 
而 危害 作物 。 不 同 种 类 的 害虫 需要 不 同 的 防治 方 
法 ,因此 ,需要 准确 地 识别 出 害虫 种 类 ,为 防治 提供 
可 靠 的 依据 。 因 鳝 却 目 昆虫 种 类 繁多 ,要 分 清 如 此 
众多 昆虫 种 类 对 于 普通 人 来 说 是 不 可 能 的 ,即使 分 
类 专家 往往 也 只 熟悉 某 一 类 群 的 昆虫 ( 徐 鹏 等 ， 
2010) 。 长 期 以 来 ,植物 虫害 的 分 析 与 鉴别 仅 局 限 
于 少数 昆虫 研究 者 、 植 保科 技工 作者 ,依靠 手工 检 
查 肉眼 观察 , 赁 主观 直觉 和 群体 经 验 来 进行 ,这 样 
得 到 的 结果 通常 被 辨别 者 的 主观 情绪 所 影响 ,识别 
率 不 稳定 ,尤其 在 时 间 长 ,工作 量 大 的 情况 下 , 误 判 
率 增加 。 检 测 不 能 实时 动态 进行 .需要 大 量 人 工 且 
采样 点 不 够 ,这 在 很 大 程度 上 限制 了 人 们 对 昆虫 的 
认识 的 普及 度 ,常常 给 农业 生产 和 经 济 活动 带 来 巨 
大 的 损失 。 而 且 一 旦 判断 错误 ,滥用 农药 进行 害虫 
的 防治 ,导致 环境 污染 ,对 人 们 的 身体 健康 及 生活 环 
境 造 成 极 大 的 威胁 。 一 种 精确 、 可 靠 且 易 操作 的 自 
动 昆虫 识别 方法 对 经 济 、 社 会 和 环境 的 发 展 具有 重 
要 意义 。 

计算 机 图 像 处 理 、 模 式 识 别 和 人 工 智能 等 技术 
的 发 展 ,使 得 通过 计算 机 自动 识别 昆虫 种 类 成 为 可 
能 。 计 算 机 技术 与 昆虫 自动 分 类 学 相 结合 的 研究 主 
要 从 20 世纪 90 年 代 开 始 。 比 较 有 代表 性 的 研究 成 
果 有 ABIS(The Automated Bee Identification System ) 
(Steinhage et al., 2001 ) . DAISY( O” Neill, 2007) 和 
SPIDA( Russell et al., 2007)3 大 软件 系统 。 近 年 来 ， 
随 着 计算 机 视觉 技术 的 进一步 发 展 ,相关 研究 人 员 
在 该 领域 不 断 有 新 的 研究 和 发 现 ( Larios et al.， 
2010; Loke et al., 2011; Kang et al., 2012; Chen et 











































































































al., 2014; Crnojevic et al., 2014)。 在 国内 ,中 国 农 
业 大 学 的 IPMIST( 植保 生态 智能 技术 系统 ) 实验 室 
也 对 基于 数学 形态 学 的 昆虫 数字 图 像 识 别 进行 了 较 
为 系统 的 研究 并 取得 了 一 定 的 成 果 ( 于 新 文 ，1999; 
赵 汗 青 等 , 2002; 杨 红 珍 等 , 2008 ) 。 此 外 , 以 昆虫 
图 像 分 割 ( 王 江宁 和 纪 力 强 , 2011) 果园 昆 虫 的 识 
别 (Wen ef al.， 2009) 果实 蝇 属 昆虫 的 识别 ( 张 蔓 
等 , 2011 ) 等 为 目标 也 有 一 些 新 的 研究 成 果 报道 。 
对 于 鳞 翅 目 昆 虫 成 虫 而 言 , 大 多 数 种 的 翅 表 面 
和 窗 盖 有 细微 的 鳞片 ,这 些 鳞片 通常 色彩 丰富 ,花纹 独 
特 ,而 且 具 有 种 内 相似 性 和 种 间 区 分 性 , 可 以 作为 
图 像 识 别 的 重要 依据 。 因 此 本 文 对 鳞 翅 目 昆 虫 图 
像 自动 识别 展开 研究 ,同时 提取 鳞 翅 目 昆虫 成 虫 
标本 图 像 的 颜色 分 布 特征 和 纹理 特征 ,生成 定 长 
特征 向 量 ,训练 分 类 器 ,最 终 实现 鳞 翅 目 昆虫 的 自 


动 分 类 。 


















































1 材料 与 方法 


1.1 鲜 翅 目 昆虫 图 像 预 处 理 

本 试验 使 用 的 昆虫 图 像 是 用 NIKON D200 数码 
相机 对 昆虫 标本 拍摄 得 到 ,相机 参数 为 光圈 Fl11, 快 
门 1/500 s ,焦距 60 mm ,图 像 格式 为 JPEGC 格式 。 标 
本 头 部 在 上 ,两 翅 向 左右 两 侧 展 开 , 图 片 中 与 昆虫 无 
关 的 背景 已 去 除 并 被 置 为 黑色 (图 1: A)。 本 文中 
的 预 处 理 方法 比较 简单 ,首先 把 彩色 图 像 转换 成 灰 
度 图 ,然后 用 固定 阐 值 法 对 灰 度 图 进行 二 值 化 ,在 该 
二 值 图 像 中 找到 最 大 轮廓 , 仅 保留 并 填充 最 大 轮廓 
内 部 区 域 为 白色 ,得 到 前 景 蒙 板 ( 图 1: B)。 对 前 景 
轮廓 求 取 最 小 包围 盒 ( 图 1 中 的 矩形 ) ,并 剪 切 出 包 
围 盒 内 部 区 域 ,对 原 彩 色 图 像 也 剪 切 出 相对 应 的 区 
域 作 为 研究 对 象 。 
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图 1 昆虫 图 像 预 处 理 


Fig. 1 





Insect image preprocessing 


A: 原 图 及 包围 盒 Original image and the bounding box; B: 前 景 蒙 板 及 包围 盒 Foreground mask and the bounding box. 





1.2 昆虫 图 像 特 征 提取 

1.2.1 颜色 名 特征 提取 :在 计算 机 视觉 领域 ,颜色 
命名 是 给 图 像 的 像素 赋 于 特定 的 语义 颜色 标签 。 颜 
色 名 可 应 用 于 图 像 检 索 、 目 标识 别 、 图 像 的 自动 内 容 
标注 、 基 于 语言 的 人 机 交互 等 场合 。 在 本 研究 中 ,使 











(van de Weijer et al.，2009 ) 中 的 方法 ,通过 从 
Google 图 像 学 习 得 到 的 PLSA-ind ( Probabilistic 
Latent Semantic Analysis-individual ) 模型 ,可 以 形成 
32 x32 x32 的 SRCB(standard Red-Green-Blue) 空间 
到 颜色 名 概率 的 查找 表 , 即 每 一 个 RGB 像素 值 , 都 








用 11 个 基本 颜色 词 来 描述 整个 颜色 空间 : 黑 、 蓝 、 
棕 \ 灰 ` 绿 \ 橙 、 粉 .紫红 \ 白 和 黄 。 要 把 颜色 命名 应 
用 到 计算 机 视觉 中 首先 需要 建立 RGB ( Red-Green- 
Blue) 颜色 空间 到 颜色 名 之 间 的 映射 。 使 用 文献 





可 以 在 查找 表 中 找到 与 其 最 接近 的 11 色 概 率 分 布 。 
这 样 ,每 一 帧 彩色 图 像 ,可 以 映射 成 11 个 概率 平面 ， 
每 个 平面 为 对 应 像素 在 某 个 颜色 名 的 概率 分 布 ,如 
图 2 














Black Blue Brown Gray Green Orange Pink Purple Red White Yellow 


RGB 颜色 值 映 射 成 11 种 颜色 名 概率 
Map RGB values to probabilities over 
11 color names 


红 白 黄 


图 2 将 RGB 颜色 值 映射 为 颜色 名 概率 分 布 


Fig. 2 Map RGB values to probabilities over color names 


把 每 个 颜色 名 概率 平面 划分 为 若干 个 3 x3 大 
小 的 网 格 (如 图 3) ,将 网 格 内 9 邻 域 的 平均 概率 值 


作为 该 网 格 中 心 点 像素 的 描述 子 ,11 个 平面 将 得 到 
长 度 为 11 的 描述 子 , 在 本 文中 , 仪 有 在 如 图 1(B) 所 
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到 3 生成 颜色 名 描述 子 网 格 划分 示意 图 


Fig. 3 Justration for grid division in generating 














color name descriptors 


Pag 
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图 4 ”直方 图 统计 空域 金字 塔 


Fig. 4 Spatial pyramid for histogram statistics 











示 白 色 蒙 板 范围 内 的 描述 子 被 保留 ,其 余 都 作为 背 
景 元 素 舍弃 。 因 为 昆虫 标本 的 大 小 形状 不 同 ,所 得 
到 的 颜色 名 描述 子 的 数量 也 会 产生 变化 ,为 了 形成 
定 长 的 特征 向 量 , 本 文 把 上 述 描述 子 用 直方 图 方式 
生成 颜色 名 词 袋 。 词 袋 的 生成 分 两 步 进行 : 训 练 生 
成 特征 词典 和 编码 成 词 袋 。 训 练 时 每 类 昆虫 的 训练 
集 图 像 中 任 取 10 个 样本 形成 词典 的 训练 集 ,用 前 述 
方法 提取 颜色 名 描述 子 ,从 这 些 颜 色 名 描述 子 集合 
中 任 取 10 000 个 使 用 k-means 方法 进行 聚 类 ,生成 























下 (van de Sande et ol.，2010 ) : 
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2 /6 
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从 该 公式 可 知 ,01,0, 分 量 对 亮度 具有 平移 不 
变性 ,0; 分 量 虽然 是 亮度 相关 的 ,但 提取 的 SIFT 描 
述 子 计算 的 是 归 一 化 后 的 梯度 方向 直方 图 (Lowe， 
2004) ,因此 也 具有 亮度 平移 和 尺度 不 变性 。 以 不 
同 的 窗口 大 小 (在 本 文中 ,分 别 用 4 x4,6 x6,8 x8， 
10 x10 大 小 的 窗口 ) 对 0 ,0, 和 033 个 通道 进行 高 
斯 平滑 处 理 ,然后 以 上 述 不 同窗 口 大 小 提取 SIFT 描 
述 子 ,考察 关键 点 位 置 的 对 比 度 , 如 果 对 比 度 小 于 阔 
值 , 则 售 去 该 关键 点 及 对 应 的 描述 子 。 同 颜色 名 描 
述 子 一 样 ,只 有 落 在 如 图 1(B) 所 示 白 色 蒙 板 范 围 内 
的 SIFT 描述 子 被 保留 。 一 个 通道 的 SIFT 描述 子 的 
长 度 为 128 ,将 同一 关键 点 对 应 的 01,0, 和 0; 的 3 
个 通道 的 描述 子 串 接 起 来 ,将 得 到 长 度 为 3 x 128 = 
384 的 OppenentSIFT 描述 子 。 由 于 不 同 图 像 提 取 到 
的 OppenentSIFT 描述 子 的 数量 会 随 图 像 内 容 而 变 
化 ,要 将 这 些 可 变数 量 的 特征 描述 子 转化 成 定 长 的 
特征 向 量 ,也 需要 经 过 池 化 和 编码 的 过 程 形成 
OppenentSIFT 视觉 词 袋 。OppenentSIFT 视觉 词 袋 
的 生成 跟 颜 色 名 视觉 词 袋 的 生成 类 似 , 用 昆虫 的 
训练 集 图 像 提 取 OppenentSIFT 描述 子 , 从 描述 子 
集合 中 任 取 10 000 个 使 用 k-means 方法 进行 聚 



























































包含 1 000 个 基 向 量 的 特征 词典 ,该 词典 可 为 所 有 
训练 图 像 和 测试 图 像 生 成 颜色 名 特征 向 量 所 共用 。 
在 编码 阶段 ,根据 得 到 的 颜色 名 描述 子 在 特征 词典 
中 查找 最 近邻 ,存储 最 近邻 的 索引 号 (长 度 为 1 000 
的 特征 词典 所 有 基 疝 量 的 索引 号 为 1 ~ 1 000 的 整 
数 ), 然后 在 1:2:4 的 空域 金字 塔 ( 图 4) 中 进行 直 
方 图 统计 并 归 一 化 ,将 得 到 长 度 为 (1 +4 +16) x 
1 000 =21 000 的 特征 向 量 。 

1.2.2 OpponentSIFT( Opponent Scale Invariant Feature 
Transform) 特征 提取 :一 般 的 SIFT 描述 子 , 都 把 图 像 
转化 为 灰 度 图 像 进行 处 理 ,这 样 就 丢失 了 颜色 信息 。 
而 颜色 本 身 提供 了 很 大 的 信息 量 ,丢弃 它 也 是 一 种 

















类 ,生成 包含 1 000 个 基 向 量 的 特征 词典 。 在 编码 
阶段 ,根据 得 到 的 OppenentSIFT 描述 子 在 特征 词 
典 中 查找 最 近邻 ,存储 最 近邻 的 索引 号 , 然后 在 
1:2:4 的 空域 金字 塔 中 进行 直方 图 统计 并 归 一 化 ， 
将 得 到 长 度 为 (1+4+16) x1 000 =21 000 的 特 
征 向 量 。 

最 后 将 颜色 名 词 袋 和 OppenentSIFT 词 袋 连接 ， 
每 一 幅 昆 虫 图 像 可 以 提取 得 到 长 度 为 42 000 的 特 
征 向 量 。 
1.3 基于 好 核 SVM( Support Vector Machine) 的 
昆虫 分 类 识别 

本 文 使 用 x 核 函数 对 上 述 特 征 进行 映射 ,映射 




















失真 。 为 了 在 描述 子 中 加 入 颜色 信息 ,本 文采 用 了 
一 种 改进 的 SIFT 特征 , 即 OppenentSIFT 特征 ,要 提 
取 OppenentSIFT 特征 ,首先 要 把 彩色 图 像 从 RGB 空 
间 转 换 到 对 立 色 (opponent color) 空间 ,转换 公式 如 





至 线性 可 分 的 更 高 维特 征 空间 后 使 用 SVM 进行 分 
类 识别 核 函 数 具 有 如 下 形式 


k(x,y) = 











(2) 


Xi i 
Xi 十 Yi 
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该 核 函 数 属于 同 质 非 线 性 加 性 核 , 为 了 使 用 线 
性 核 的 高 效 的 学 习 方 法 来 解决 非 线 性 核 问 题 ， 
Vedaldi 和 Zisserman(2012 ) 提出 了 特征 映射 的 显 式 
解析 公式 : 





[w(x)], = ee Vxk(A) (3) 
此 处 实数 入 相当 于 特征 向 量 y(x%) 的 索引 ,x 
(4A) 为 签名 K(w) 的 傅立叶 逆 变 换 : 


«(A) = Kv) do (4) 





其 中 
K(w) = sech(w/2) (5) 
此 处 映射 得 到 的 特征 向 量 为 无 限 维度 ,有 限 维 
度 的 向 量 可 以 通过 有 限 数量 的 采样 点 近似 得 到 。 有 
限 维 的 特征 映射 冰 (x) 可 以 对 式 (3) 在 点 和 A = -nL， 
(一 n+1)L,…, nL 处 采样 得 到 w(x) 的 近似 。 通 过 
充分 利用 y(x) 的 对 称 性 ,将 实 部 赋 于 奇 单元 , 虚 部 
赋 于 侦 单 元 , 则 向 量 六 (x) 可 定义 为 : 
































[W(x) j - 
VaxL 
vxK(0) J=0 
/2k( Deos(t Dig) J > 0，odd 


2K( 施 L)sin( 广 /logr) J] > 0，even 


(6) 
其 中 j=0,1,…,2n。 这 样 ,根据 给 定 的 核 函 数 ， 
可 由 上 式 简单 高 效 地 产生 特征 映射 的 封闭 形式 ,在 
本 文中 , 取 n=1, 则 原 特 征 向 量 中 每 个 数据 点 被 映 
射 成 3 个 采样 点 ,特征 维度 被 放大 为 原来 的 3 倍 。 
用 映射 得 到 的 训练 集 特征 向 量 训练 L2- 正 规 化 
L1 损失 带 正 偏 移 的 线性 SVM 分 类 器 。 即 对 如 下 
公式 








y = WX+Db, (7) 

对 每 一 类 训练 样本 和 集 |X;,y;| (i=1,…,n), 根 

据 训 练 集 数据 计算 出 最 优 的 下; 和 2b;, 其 中 对 每 一 个 
i, XX; 是 特征 向 量 ,y, 是 类 标签 , + 1 表示 正 例 , -1 
表示 反例 (训练 时 把 本 类 的 设置 为 正 样本 ,其 他 类 
设 为 负 样 本 ) ,n 类 样本 将 训练 出 n 组 | 开 ,,b;) ,形成 
n 个 线性 SVM 分 类 器 。 对 于 本 文 的 多 类 分 类 问题 ， 
给 定 一 个 未 知 类 别 的 测试 样本 蕊 ,用 如 下 方式 确定 


类 标签 : 























1 = argmax( W,X’' + 0b,) (8) 
/ 即 为 识别 得 到 测试 样本 所 属 类 的 编号 。 




















2 结果 


上 述 方法 在 装 有 Matlab R2010b 的 PC 机 上 实 
现 ,CPU 为 Intel Core2 2.53 GHz, 内存 为 3.46 GB。 
创建 的 图 像 库 中 包含 10 类 昆虫 ,每 类 昆虫 有 47 ~ 
69 个 不 同 图 像样 本 。 这 10 类 昆虫 为 : 白 黑 华 若 蛾 
Agylla ramelana 、 朝 尺 峨 Pseudopanthera corearia、 淡 
眉 夜 蛾 Pangrapta zzmbrosa 、 稻 上 暗 水 版 Bradina 
adrmzixtalzs 点 眉 夜 蛾 Pangrapta vasavQ、 冬 麦 沁 夜 蛾 
Rhyacia aueguridis、 黑 缘 岩 尺 蛾 Scopula virgulata、 黄 
斑 眉 夜 蛾 Pangrapta flavonacula. 黄 边 土 若 蛾 hilema 
usuguronis 和 灰 双 纹 迪 Herculia glaucinalis ,在 表 1 和 
表 2 中 依次 对 应 编号 1 ~ 10。 在 每 类 昆虫 内 ,我 们 
随机 选择 其 中 的 4/5 作为 训练 样本 , 剩 下 的 共 112 
个 图 像 作为 测试 样本 。 所 有 的 样本 经 过 预 处 理 , 并 
用 第 1.2 节 介 绍 的 方法 提取 特征 ,由 此 每 幅 图 像 可 
以 提取 到 长 度 为 42 000 的 特征 向 量 ,通过 第 1.3 证 
介绍 的 方法 映射 成 126 000 维 的 高 维特 征 再 用 线性 
SVM 分 类 器 分 类 , 分 类 得 到 的 混 消 矩阵 如 表 1 所 
示 。 从 表 中 数据 可 知 , 所 有 测试 样本 都 出 现在 对 角 
线 上 ,表明 被 正确 分 类 。 

表 2 是 本 文 方法 与 基于 颜色 直方 图 和 双 树 复 小 
波 ( 笠 乐 庆 等 , 2010) 、 基 于 区 域 平均 颜色 特征 (Zhu 
and Zhang, 2012 ) 基于 稀 玻 编码 和 量化 共 斩 梯 度 反 
向 传播 神经 网 络 (SCG BPNN )( 笠 乐 庆 和 张 真 ， 
2013 ) 等 方法 在 同一 数据 集 上 测试 的 识别 率 比 较 ， 
识别 率 定 义 为 正确 分 类 次 数 与 总 测试 次 数 的 比值 。 
其 中 第 1 种 方法 仅 用 颜色 直方 图 和 双 树 复 小 波 进行 
特征 提取 , 预 处 理 与 分 类 过 程 则 与 基于 区 域 平均 颜 
色 特 征 (Zhu and Zhang, 2012) 的 方法 相同 。 从 表 2 
可 知 , 本 文 方法 的 识别 正确 率 明 显 优 于 区 域 平 均 颜 
色 特 征 方法 。 需 要 说 明 的 是 , 表 2 中 前 3 种 方法 在 
预 处 理 阶 段 都 需要 对 双 翅 进行 分 割 并 且 分 割 后 的 双 
翅 还 需要 进行 位 置 对 齐 , 而 本 文 方法 仅 需 要 确定 包 
围 盒 即 可 ,一 方面 减少 了 预 处 理 步骤 的 复杂 性 ; 另 一 
方面 , 双 翅 的 分 割 与 对 齐 需 要 对 昆虫 的 轮廓 进行 跟 
踪 和 拟 合 ,轮廓 提取 的 精确 性 对 分 割 和 对 齐 影 响 较 
大 ,轮廓 稍 受 干扰 即 直 接 影 响 预 处 理 的 结果 ,算法 和 鲁 
棒 性 欠 佳 ,而 本 文 方法 直接 在 成 虫 整体 图 像 上 进行 
特征 提取 ,对 轮廓 的 容错 性 较 好 ,因此 , 表 2 中 基于 
稀 玻 编码 和 SCG BPNN 的 方法 虽然 测试 所 得 精度 与 
本 文 方法 相当 ,但 其 容错 性 与 实用 性 仍 难 以 与 本 文 
方法 相 比拟 。 
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表 1 本 文 方法 识别 10 类 鳞 翅 目 昆 虫 标本 图 像 的 混淆 和 矩阵 
Table 1 Confusion matrix for recognizing ten classes of lepidopteran specimens with the proposed method in this study 

1 2 3 4 5 6 7 8 9 10 
1 13 0 0 0 0 0 0 0 0 0 
2 0 11 0 0 0 0 0 0 0 0 
3 0 0 12 0 0 0 0 0 0 0 
4 0 0 0 10 0 0 0 0 0 0 
5 0 0 0 0 9 0 0 0 0 0 
6 0 0 0 0 0 12 0 0 0 0 
~ 0 0 0 0 0 0 9 0 0 0 
8 0 0 0 0 0 0 0 10 0 0 
9 0 0 0 0 0 0 0 0 13 0 
10 0 0 0 0 0 0 0 0 0 13 





第 1 列 为 测试 样本 的 实际 乡 


号 ,第 1 行为 讽 








试 样本 被 分 类 的 编号 , 表 中 数据 为 分 类 样本 数 。The 1st column gives the gound truth of testing 





samples the lst row gives the class number of the classification results, and the data in the table body are the number of samples classified. 


表 2 本 文 方法 识别 正确 率 ( %) 及 与 其 他 方法 的 结果 比较 




















Table 2 Recognition accuracy ( % ) of the proposed method in this study and its comparison with previous methods 
序号 颜色 直方 区 和 双 树 复 小 波 区 域 平均 颜色 村 征 稀 玻 编码 和 SC BPNN 本 文 方法 
No. Color histogram Local mean color feature Sparse coding and Proposed method 

and DTCWT based method SCG BPNN in this study 
1 80.6 100 100 100 
2 100 100 100 100 
3 82.1 75.0 100 100 
4 100 70.0 95.0 100 
5 86.2 88.5 100 100 
6 100 91.7 100 100 
gl 86.2 88.9 100 100 
8 84.6 100 100 100 
9 100 100 100 100 
10 100 100 100 100 
平均 Average 91.98 91.96 99.43 100 





表 3 给 出 了 本 文 算法 各 步骤 的 时 间 性 能 ,从 表 
3 知 ,虽然 本 文 方法 提取 的 特征 维度 偏 高 ,但 对 单 帧 
图 像 的 识别 仍 能 满足 实时 响应 的 要 求 。 表 中 数据 不 
包括 颜色 名 和 OpponentSIFT 特征 码 本 生成 过 程 , 训 


练 码 本 与 训练 SVM 分 类 器 一 样 , 只 需要 在 建立 模型 
时 执行 一 次 ,此 后 便 可 长 期 使 用 ,因此 不 影响 实际 识 
别 的 时 间 性 能 。 





表 3 本 研究 方法 各 过 程 的 时 间 性 能 


Table 3 Time performance of each procedure of the method used in this study 











过 程 预 处 理 特征 提取 训练 单个 SVM 分 类 单个 样本 
Procedures Preprocessing Feature extraction Training one SVM Classify single sample 
时 间 Time (ms) 8 843 1 042 9 


3 ”讨论 与 结论 


本 文 提出 了 一 种 全 新 的 鳞 翅 目 昆虫 图 像 特征 描 
述 方式 ,从 而 可 使 用 鳞 翅 目 昆 虫 标 本 图 像 实 现 对 昆 
虫 种 类 的 识别 。 去 除 背 景 后 的 鳞 翅 目 昆虫 图 像 经 过 














Tr 











预 处 理 求 取 最 小 包围 盒 和 前 景 蒙 板 , 提取 蒙 板 范围 
内 昆虫 图 像 的 颜色 名 词 袋 特征 和 OpponentSIFT 词 
袋 特征 ,连接 成 定 长 的 特征 向 量 。 最 后 为 每 一 类 昆 
虫 训练 x 核 SVM, 以 显 式 的 x 核 近似 变换 公式 首 
先 将 特征 向 量 映 射 到 更 高 维 空间 ,以 高 维特 征 问 量 
训练 线性 SVM ,以 实现 分 类 识别 。 该 方法 在 包含 10 
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类 鳝 翅 目 昆虫 的 图 像样 本 库 中 进行 了 测试 ,测试 结 
表明 , 该 方法 在 识别 的 精度 以 及 时 间 性 能 方面 都 
表现 出 比较 理想 的 效果 ,与 之 前 实现 的 几 种 识别 方 
法 进行 比较 的 结果 表明 ,本文 提出 的 鳞 翅 目标 本 图 
像 识别 方法 在 识别 正确 率 上 有 了 明显 的 优势 ,而且 本 
文 提出 的 方法 预 处 理 过 程 更 简单 ,容错 能 力 更 好 ,有 
更 强 的 抗 干扰 能 力 。 测 试 数据 集 上 100% 的 识别 正 
确 率 证 明了 本 文 提 出 的 鳞 翅 目 昆虫 图 像 识 别 方法 的 
有 效 性 。 
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